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摘要 : 非 侵入 式 负荷 分 解 能 够 充分 解析 用 户 用 电 数 据 ， 是 分 析 评 估 用 户 柔 性 调控 潜力 的 关键 技 
术 。 鉴 于 深度 学 习 方法 在 负荷 分 解 的 广泛 应 用 , BARA TER MAS. RIP AA, 
卷 积 神经 网 络 等 主流 深度 学 习 网 络 结构 应 用 在 负荷 分 解 问题 时 的 工作 机 理 ， 并 对 它们 在 负荷 分 
解 领域 中 的 应 用 与 发 展 进 行 了 展望 分 析 ; 之 后 ， 提 出 了 基于 不 同 维度 的 分 解 算法 评价 框架 ， 并 
补充 了 评价 过 程 中 测试 数据 的 选择 规范 ; 最 后 ， 利 用 该 评价 框架 对 主流 的 深度 学 习 分 解 模型 进 
行 评价 ， 并 对 模型 代码 进行 了 开源 ， 评 价 结果 证 明 所 提 框 架 更 能 综合 地 评价 给 定 超 参 设置 下 的 
深度 学 习 分 解 模型 ， 并 揭示 模型 性 能 关于 网 络 结构 、 特 征 输入 等 因素 的 敏感 性 。 

关键 词 : 深度 学 习 ; 非 侵入 式 负荷 分 解 ; 卷 积 神经 网 络 ; 循环 神经 网 络 ; 用 电大 数据 


0 引言 模 , 且 解 码 的 时 间 复 杂 度 随 设备 数目 呈 指 数 级 别 增 
非 侵入 式 负 荷 监 测 (Non-intrusive Load 长， 这些 都 限制 了 FHMM 族 模型 的 应 用 。 
Monitoring, NILM) ， 最 早 由 Hart 于 20 世纪 80 年 EEE, 深度 学 习 通 过 加 深 神 经 网 络 可 以 实现 
代 提 出 由， 是 指 在 居民 用 电 入 口 处 安装 智能 电表 ， 对 任意 物理 模型 的 近似 6。 文献 [13] 利 用 双向 长 短 
经 过 一 系列 数据 挖掘 步骤 , 将 总 负荷 信息 表征 为 各 期 记忆 (Bidirectional Long Short Term Memory, Bi- 
独立 设备 的 用 电 情况 。 通 过 这 种 方式 获得 的 终端 数 LSTM) 、 降 噪 自 编码 器 (Denoising AutoEncoder, 
据 可 为 用 户 提供 反馈 信息 ， 提 升 家 庭 的 节能 意识 DAE) 等 深度 学 习 模 型 为 设备 功率 建 模 。 相 较 于 传 
23]， 并 为 需求 响应 外 提供 数据 支撑 统 方法 ,深度 学 习 方法 具有 : i 无 需 进 行人 工 特征 


1: y Ju i Eur Ar Æ- Fri E Ze ME 
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分 解 算法 大 多 基于 负荷 事件 探测 ， 以 组 合 优化 K ii. 可 以 对 功率 连续 变化 的 设备 进行 建 模 ， 并 忽 
(Combination Optimization, CO) 9), AES yt gU 略 未 知 设备 的 影响 iv. 可 利用 GPU 并 行 计 算 等 
主 , 但 由 于 负荷 印记 重 登 、 难 以 处 理 功率 连续 变化 然 代 势 。 
日 典 特 问题 的 存在 , 分 解 精 度 较 低 。 因子 马尔 可 夫 然而 ,深度 学 习 模 型 参数 众多 、 解 释 性 差 、 对 
(Factorial Hidden Markov Model, FHMM) 、 深 度 神 超 参 的 选择 敏感 , 因而 揭示 网 络 结构 背后 的 工作 机 
经 网 络 等 模型 可 以 有 效 地 提升 分 解 精度 , 成 为 解决 。 于 对 于 算法 设计 、 参 数 调整 等 尤为 重要 。 同 时 ， 由 
负荷 分 解 问题 的 主流 算法 中 。 于 测试 数据 与 评价 指标 选取 的 不 同 ,研究 者 们 难以 

FHMM 族 模型 依赖 较 少 的 监督 信息 即 可 达到 系统 地 比较 分 解 算法 的 优 劣 0531， 找 出 模型 表现 从 
一 定 的 分 解 精度 。 文 献 [9 将 家 用 电器 的 使 用 模 起 佳 的 原因 ， 并 有 针对 性 地 改进 分 解 算法 。 


In 


作为 附加 特征 ， 分 别 基 于 四 种 不 同 的 FHMM 建立 基于 非 侵入 式 负荷 分 解 领域 的 研究 现状 ,本 文 


分 解 模型 ， 文 献 [10] 通 过 对 信 源 的 信号 约束 , 将 。 站 先 探讨 了 降 噪 自 编码 器 、 循 环 神经 网 络 
FHMM 的 推断 问题 转化 为 凸 二 次 规划 问题 进行 求 Rn Neural Network, RNN) 、 pum A n 络 
解 。 然 而 ， 受 限于 马尔 可 夫 链 的 性 质 ，FHMM 族 buie dL ue o ap erat 
模型 无 法 对 功率 连续 变化 及 未 知 电气 设备 进行 建 POST SCRE LR TELE Mii Bi 


LSTM 层 对 有 效 负荷 信息 的 双向 编码 及 卷 积 层 对 助 模 型 更 好 地 理解 负荷 信息 ) 可 以 被 看 作 DAE 的 
不 同 负 蓓 事件 的 抽取 是 深度 学 习 模 型 应 用 的 关键 。 输入 ， 待 预测 独立 电气 设备 的 功率 序列 被 视 作 
之 后 ,提出 了 考虑 不 同 维度 的 负荷 分 解 算法 评价 框 DAE 的 输出 ， 而 其 它 电气 设备 在 同时 段 的 功率 则 


架 , 并 从 数据 集 与 待 测 电器 两 方面 对 测试 数据 的 选 被 作为 模型 需要 消除 的 噪声 。 

择 做 出 规范 。 最后, 利用 该 评价 框架 对 主流 的 深度 iia rin 

学 习 分 解 算法 做 出 评价 , 揭示 了 不 同 模型 性 能 的 差 aa B 

异 主要 源 于 网 络 结构 对 不 同 负荷 信息 建 模 的 侧重 [E i 本 四 "ANE 

不 同 ,之 后 通过 算 例 分 析 说 明了 输入 特征 等 因素 对 m IB; «sg 

于 模型 分 解 性 能 的 影响 , 并 对 改进 算法 提出 了 意见 。 0 SIP e T . 

此 外 ,本 文 还 对 模型 实现 及 评价 的 代码 进行 了 开源 0| 了 | 一 一 ET 

(https://github.com/Ming-er/NeuralNILM Pytorch) . PET sna zu VENE 
MR Pa 二 中 输入 特征 中 间 层 瓶颈 层 中 间 层 输出 序列 
负荷 分 解 要 求 将 一 段 时 间 序 列 的 总 负荷 信息 Fig.1 Schematic diagram of the basic structure of the 

DAE models 
表示 为 相应 组 成 信号 的 线性 组 合 ， 对 于 序列 当中 的 
一 个 时 间 节 点 ， 负 和 荷 分 解 问题 可 以 被 抽象 成 如 下 的 1 DAE 类 模型 的 基本 结构 示意 图 ， 其 网 
eo AFERA: 络 结构 可 分 为 编码 器 、 解 码 器 两 个 部 分 。 其 中 ， 编 


uc? npe (1) 码 器 对 输入 特征 进行 特征 提取 与 组 合 , 并 将 其 压缩 

228 成 一 个 紧凑 表达 形式 一 一 瓶颈 层 , 而 解码 器 则 需要 

sub. y 代表 ; 时 刻 的 总 功率 ，x ,为 第 ; 个 电气 设 ”根据 瓶颈 层 所 蕴含 的 信息 对 特定 电器 设备 的 功率 
| 序列 进行 重 构 。DAE 对 重 构 损 失 的 梯度 优化 限制 
备 在 ! 时刻 的 功率 , y 为 未 知 电气 设备 在 1 时 刻 的 总 了 瓶颈 层 特征 区 含 总 功率 序列 中 利于 重 构 当前 | 


功率 ， 为 随机 噪声 ， 满 足 8 ~N (O02), 1 代表 电器 功率 的 信息 ， 也 提升 了 之 后 解码 器 的 解码 能 
文献 [13] 最 早 将 DAE 应 用 于 负荷 分 解 ， 得 到 
MEE 的 分 解 效果 优 于 CO, FHMM 等 传统 方法 , 但 由 于 
考虑 到 神经 网 络 对 端 到 端 映射 强大 的 表征 能 “网络 结构 较为 简单 ， 并 未 真正 体现 出 DAE 模型 的 
序列 与 第 i 个 电气 设备 功率 序列 间 的 映射 关系 并 在 编码 、 解 码 过 程 中 添加 了 卷 积 、 归 一 化 、 残 关 


f :yn Yaz Jr] ED > [Xio Hr EOF ; E} 等 设计 ,i 步 提 升 了 DAE 模型 的 分 解 精 度 。 
而 不 需要 考虑 用 户 不 感 兴 趣 的 电气 设备 及 其 它 未 DAE 
n x " — —— " 该 时 段 总 
知 电 设备 对 分 解 效果 的 影响 。 深度 学 习 模 型 多 采 ee ^ EN. 重 构 损 失 该 时 段 真实 的 
PT » SNR 电器 功率 序列 
© 用 如 下 形式 定义 问题 ， 附加 特征 z 
y, 2X, +O +Ò, (2) CANI 
> 判别 器 一 > Hor fi < > 假 
i " 、 , F — 该 时 段 总 d | ES 
RP: o, 为 除 第 ; 个 电气 设备 以 外 其 它 电气 设备 uS NEL m 
mum | ae > Aor < DS 
E tS] aL E] JJ ARS 电器 功率 序列 
目前 ， 应 用 在 负荷 分 解 领域 的 深度 学 习 模型 以 图 将 GAN 融入 负荷 分 解 模型 
u Hou Y MA dr Fig.2 Training a GAN that maps main readings to 
z 5 Am ZA Ld ZA Aix 
降 噪 自 编码 器 、 循 环 神经 网 络 、 卷 积 神经 网 络 等 网 target individual appliance readings. 
络 为 主 。 
1.1 DAE 类 模型 近 些 年 来 ， 随 着 生成 对 抗 网 络 户 ](Generative 


DAE 接受 含 噪声 的 数据 作为 输入 ， 并 将 其 重  Adversarial Network, GAN) HNE, VEA Ea? 
构 为 原始 不 含 噪声 的 数据 输出 09, 在 图 像 去 噪 、 语 尝试 将 GAN 融入 DAE 模型 对 负荷 编码 、 解 码 的 
音 增 强 等 领域 有 着 广泛 的 应 用 0713。 在 负荷 分 解 问 Whe, 其 基本 思想 如 图 2 所 示 。 这 种 方式 的 优势 在 
题 中 ， 总 功率 序列 与 其 它 序 列 (时 间 惟 信息 09] 及 无 “于 不 改变 DAE 模型 的 结构 ， 而 是 引入 判别 器 对 其 
功 功率 等 电气 特征 29 可 作为 补充 的 语义 背景 ， 辅 ”预测 的 输出 序列 进行 真 假 判 别 , 并 通过 优化 判别 所 


产生 的 判别 损失 来 逐次 更 新 DAE 与 判别 器 使 其 对 


Pii 


判 约 ， 在 提升 判别 器 分 辨 能 力 的 同时 , 也 可 以 使 


得 DAE 的 输出 更 加 接近 真实 值 。 
1.2 RNN 类 模型 


RNN 是 一 类 以 序列 数据 为 输入 ， 在 序列 的 演 


进 方向 进行 递归 且 所 有 节点 按 链 式 连接 的 递归 神 
经 网 络 P5, 在 时 间 序 列 建 模 中 被 广泛 使 用 。 其 中 ， 

较为 典型 的 模型 是 长 短期 记忆 [3 (Long Short 
Term Memory, LSTM) 与 门 控 循 环 单元 B0 (Gated 


Recurrent Unit, GRU) ， 它 们 解决 了 传统 RNN 梯度 
消失 的 问题 ， 


AX 
的 
解码 


系 的 推理 能 力 。 随后, LSTM 隐藏 状态 所 记 住 


了 效 编码 信息 被 最 后 的 全 连接 层 整 合 归纳 , 最 终 


得 到 相应 时 段 的 电器 功率 序列 。 
文献 [13,31] 最 早 将 RNN 应 用 在 负荷 分 解 问题 ， 


He a 
= JJ 
N 


每 个 用 电器 构建 了 较为 原始 的 LSTM 模型 ， 


使 模型 能 够 学 习 总 功率 序列 到 电器 功率 序列 的 映 


射 关 
网 络 
模型 


Za, 文献 [32] 将 结构 更 为 简单 的 双向 门 控 循环 
(Bidirectional Gated Recurrent Unit, Bi-GRU) 
应 用 于 负荷 分 解 , 并 利用 滑动 窗口 来 预测 总 功 


使 得 RNN 可 以 把 握 功 率 序 列 中 间隔 


较 长 的 时 间 依赖 关系 , 并 对 负荷 数据 前 后 的 关联 信 
县 做 出 记忆 与 判断 ,如 功率 序列 中 时 间 间 隔 较 长 的 


负荷 事件 等 。 
ES 
F 
前 一 时 间 Em 后 一 时 间 
eA" x m » passe 
a tanh 
前 一 时 间 cow NA. 后 一 时 间 
步 的 隐藏 9 0 tanh o 步 的 隐藏 
状态 mu D 


LSTM 为 主要 组 成 ， 图 4 是 LSTM 细胞 工作 原理 
图 ,模型 的 工作 过 程 可 分 为 纺 


当前 时 间 步 总 功率 


4LSTM 细胞 工作 原理 示意 图 
Fig.4 Working principle diagram for LSTM cell 


图 3 是 RNN 类 模型 的 基本 结构 示意 图 , 以 Bi- 


码 、 解 码 两 个 主要 过 


程 。 首 先 ，Bi-LSTM 层 接收 输入 窗口 内 的 序列 特 


征 ， 


开 按 照 正 、 反 两 个 方向 对 其 中 的 负荷 信息 与 语 


义 背 景 进行 信息 组 合 与 编码 传递 : 与 待 分 解 时 间 点 
相关 联 的 有 效 信 息 被 传递 给 后 一 个 LSTM 细胞 ， 
不 相关 联 的 无 效 信息 则 被 丢弃 , 正 反 两 个 方向 的 信 


恩 传 递 可 以 进 


附加 序列 特征 (可 选择 ) ”总 功率 序列 


步 地 增强 模型 对 负荷 事件 之 间 因 


mams 
o 
co); + a 
ZZ g 
其 它 电气 特征 


时 间 


输入 特征 


率 序 


提升 
能 。 
平行 
抽取 
JE. 
了 人 


(Sequence-to-Sequence, Seq2Seq) 模型 进行 训练 ， 


同时 


制 , 使 得 模型 对 负荷 信息 解码 的 不 同时 刻 


侧重 
jE Bl) 
时 间 


类 模 
行 多 
耗 情 
解 模 


出 了 


列 中 间 时 间 点 所 对 应 的 用 电器 功率 。 
随后 ， 对 RNN 类 模型 应 用 的 研究 开始 着 重 于 
模型 编码 、 解码 的 能 力 ， 以 进一步 优化 模型 性 
文献 [33] 在 Bi-LSTM 上 游 加 入 了 不 同 尺寸 的 
卷 积 核 进一步 增强 了 模型 对 负荷 数据 特征 的 
能 力 , 使 得 负荷 信息 在 编码 前 得 到 了 有 效 的 过 
文献 [34] 与 文献 [35] 都 对 连续 的 功率 信息 进行 
为 的 离散 编码 , 并 结合 序列 翻译 的 序列 到 序列 


JJ Attention 机 
不 同 的 
， 提 升 了 对 负荷 信息 的 利用 能 力 。 文 献 [36] 考 
特定 电器 经 常 工 作 在 特定 时 段 , 将 负 葵 数据 的 
BT SJ Bi-GRU 模型 中 。 


， 文 献 [34] 在 解码 过 程 中 采 


同时 ， 也 有 许多 研究 尝试 从 整体 上 优化 RNN 
型 。 文 献 [37] 利 用 参数 权重 共享 的 Bi-GRU 进 


任务 学 习 , 同时 学 习 电 器 的 开关 状态 及 功率 消 
况 ,在 推断 时 相 较 于 只 学 习 功 率 变 化 模式 的 分 
型 对 噪声 具有 更 好 的 鲁 棒 性 ,文献 [38] 针 对 [13] 


中 Bi-LSTM 模型 训练 时 可 能 出 现 的 过 拟 合 问题 给 


正则 化 的 方式 , 文献 [39,40] 则 分 别 利 用 贝 叶 斯 


优化 及 TPE 算法 给 出 了 Bi-LSTM 模型 超 参 数 的 较 
优选 择 策略 , 使 得 模型 对 于 现实 问题 的 适应 性 得 到 


时 间 


电器 功率 序列 
输出 序列 
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3 RNN 类 模型 基本 结构 示意 图 
Fig.3 Schematic diagram of the basic structure of the RNN models 
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附加 序列 特征 (可 选择 ) ”总 功率 序列 
输入 一 维 卷 积 层 


JL 


A 


输出 窗 


OOOOOO 


电器 功率 序列 
一 维 卷 积 层 。 全 连接 层 输出 


5 CNN 类 模型 基本 结构 示意 图 
Fig.5 Schematic diagram of the basic structure of the CNN models 


13 CNN 类 模型 
CNN 是 一 类 由 卷 积 层 、 池 化 层 为 主要 组 成 的 
前 馈 神 经 网 络 ,， 由 于 卷 积 运算 的 特性 ,神经 元 可 以 
响应 一 部 分 履 盖 范围 内 的 周围 单元 ， 因 而 CNN 对 
局 部 特征 有 较 强 的 抽取 能 力 , 如 功率 序列 中 某 个 时 
间 点 正在 发 生 的 负荷 事件 等 .CNN ZEAE SP HTM 
文本 分 类 中 1 等 序列 建 模 任务 中 有 着 广泛 应 用 ， 研 
究 表 明 ，CNN 对 于 某 些 时 序数 据 的 表达 能 力 要 胜 
过 RNNI?I, 
图 5 是 CNN 类 模型 的 基本 结构 示意 图 ， 以 尺 
寸 不 同 的 卷 积 核 为 主要 组 成 ,一 维 卷 积 层 对 输入 窗 
内 的 序列 信息 进行 特征 提取 : 不 同 层 内 , 尺寸 不 
同 的 卷 积 核 探 测 不 同时 间 尺 度 的 负荷 事件 ; 同一 层 
内 ， 不 同 通道 的 卷 积 核 则 探测 不 同 强度 (功率 变化 
幅 值 大 小 ) 的 负荷 事件 ， 附 加 的 序列 特征 类 似 于 图 


像 的 背景 像素 , 可 作为 语义 信息 被 卷 积 核 一 起 捕捉 。 


靠 前 的 卷 积 层 感受 野 较 小 ,通常 只 能 把 握 序列 的 简 
单 变化 模式 , 但 具有 较 高 的 分 辨 率 , 靠 后 的 卷 积 层 
则 可 以 对 这 些 简单 模式 进行 组 合 , 学 到 更 为 复杂 的 
负 蓓 特征 及 语义 信息 。 最 后 的 全 连接 层 对 之 前 卷 积 
层 所 探测 到 的 负 蓓 特征 进行 信息 整合 , 并 输出 最 终 
的 电器 功率 序列 。 

文献 [43] 利 用 多 个 不 同 尺 寸 的 卷 积 核 与 顶端 
的 全 连接 层 搭 建 了 序列 到 点 (Sequence-to- 
Point, Seq2Point) 模型 ， 并 对 卷 积 核 进行 了 可 视 化 ， 


归 网 络 所 产生 的 功率 序列 是 否 属于 当前 电器 , 文 
[24,45] 构 建 了 门 控 分 支 网 络 , 一 个 卷 积 网 络 用 于 
输出 电气 设备 的 开关 状态 , 另 一 个 卷 积 网 络 用 于 预 
测 电气 设备 的 功率 值 , 两 个 网 络 输出 的 哈达 玛 积 被 
作为 最 终 的 预测 结果 。 它 们 的 研究 都 是 希望 利用 
CNN 对 负荷 事件 的 辨识 能 力 产 生 额 外 的 信息 流 ， 
抑制 假 阳 性 样本 的 出 现 , 以 此 提高 负荷 分 解 的 准确 
性 。 


= Im] 


对 于 CNN 类 模型 性 能 优化 的 研究 主要 集中 在 
提升 卷 积 核对 负荷 事件 的 探测 能 力 。 文 献 [46] 在 [43] 
研究 的 基础 上 提出 了 卷 积 块 注意 力 机 制 , 从 通道 维 、 
空间 维 两 方面 定义 卷 积 特征 的 重要 程度 , 使 得 模型 
对 于 中 间 特 征 的 把 握 更 有 侧重 ; 文献 [46] 借 鉴 了 音 
频 生成 网 络 WaveNet[] 扩 张 卷 积 、 跳 层 连 接 等 设计 
思想 , 构建 的 WaveNILM 网 络 拥 有 更 大 的 感受 野 ， 
对 长 期 负荷 事件 有 了 更 强 的 把 握 能 力 ; SCHACH 
鉴 了 图 像 分 割 网 络 U-Net[49] 多 分 辨 率 特 征 融合 的 
设计 思想 ， 构 建 的 U-NetNILM 网 络 可 以 兼顾 长 短 
期 负荷 事件 ; 文献 [50-52] 都 将 负荷 信号 建 模 为 二 维 
图 像 , 类 比 卷 积 神经 网 络 对 图 像 局 部 特征 的 学 习 能 
力 构 建 了 负荷 分 解 模型 。 


2 负荷 分 解 算法 评价 框架 


本 节 首 先 提出 比较 负荷 分 解 算法 的 评价 框架 ， 
然后 对 其 中 的 具体 细节 进行 说 明 ， 评 价 框架 的 流程 


说 明了 不 同 通道 的 卷 积 核对 不 同 的 负荷 事件 有 着 
不 同 的 激活 程度 。 

之 后 的 许多 研究 开始 对 CNN 的 这 一 特性 加 以 
利用 ， 文 献 [44] 根 据 CNN 所 提取 的 负荷 特征 判断 


图 如 图 6 所 示 。 


6 负荷 分 解 算法 评价 框架 流程 图 


Fig.6 Flowchart of the proposed evaluation framework of 


energy disaggregation algorithms 


从 上 述 流程 图 中 可 以 看 出 ， 本 文 所 提出 的 评价 
框架 涉及 多 个 维度 的 比较 ， 这 些 评 价 维度 的 选取 都 
是 基于 综合 比较 负荷 分 解 算 法 而 设 定 的 。 

在 训练 过 程 中 ， 预 先 评估 模型 训练 、 部 署 、 应 
用 时 的 时 空 效率 。 训 练 效 率直 接 影响 着 迭代 开发 时 
的 训练 成 本 ,同时 决定 了 一 个 负荷 分 解 算法 能 否 通 
过 数据 增 广 扩展 到 更 复杂 的 现实 场景 。 同 时 ， 随 着 
边缘 计算 物 联网 架构 在 电力 领域 得 到 部 署 应 用 
负荷 分 解 模型 未 来 将 广泛 存在 于 向 入 式 终端 ， 模 型 
的 空间 复杂 度 将 直接 影响 模型 的 部 署 难 度 。 此 外 ， 
模型 分 解 的 计算 效率 也 决定 着 嵌入 式 终 端 能 否 给 
予 用 户 实时 的 信息 反馈 。 

在 相同 的 场景 下 对 模型 进行 测试 ， 主 要 考虑 模 
型 的 辨识 准确 性 与 回归 准确 性 。 辨 识 准 确 性 与 模型 
对 负荷 事件 的 判断 息息相关 ， 在 异常 检测 、 环 境 畏 
助 生活 等 领域 有 着 重要 的 应 用 ， 回 归 准 确 性 主要 考 
察 功率 分 解 值 的 准确 度 ， 以 向 用 户 提 供 及 时 准确 的 
功 耗 信息 ， 辅 助 决策 者 进行 决策 ， 这 也 是 非 侵入 式 
负荷 分 解 非常 关注 的 数值 特征 。 

在 不 同 的 场景 下 对 模型 进行 测试 ， 可 以 比较 分 
解 模 型 的 泛 化 性 能 。 泛 化 性 能 的 考察 是 必须 的 ， 在 
现实 生活 中 ， 获 得 独立 电器 设备 负荷 信息 的 代价 是 
巨大 的 ， 这 也 正 是 非 侵入 式 负荷 分 解 相 较 于 侵入 式 
负荷 分 解 的 优势 所 在 。 泛 化 性 能 的 好 坏 反 映 了 一 个 
分 解 模型 在 有 限 的 训练 数据 中 提取 了 足够 有 效 的 


— 


这 直接 决定 了 一 个 负荷 分 解 模型 能 否 在 现实 生活 
中 得 到 广泛 应 用 。 


值得 注意 的 是 ， 本 文 所 提出 的 评价 框架 是 对 负 
荷 分 解 算法 的 一 种 综合 性 评价 流程 ， 实 际 操作 时 ， 
研究 者 可 以 自行 根据 模型 的 应 用 范畴 有 针对 性 地 
进行 相应 的 删改 与 侧重 。 


负荷 特征 信息 ， 还 是 只 记 住 了 数值 变化 的 简单 模式 ， 


2.1 评价 指标 选择 
2.1.1 模型 预 评估 
L 训练 效率 
为 了 衡量 分 解 模型 的 训练 效率 ， 本 文选 择 了 模 
型 训练 收敛 的 平均 时 间 z 作为 主要 评价 指标 ,1 越 小 
的 模型 ， 相 应 地 在 学 习 与 参数 调整 上 花费 的 时 间 也 
越 少 ， 可 以 认为 其 对 待 解决 问题 具有 更 强 的 适应 性 ， 
同时 ， 也 可 以 减少 算法 研究 的 迭代 成 本 。 
IL 部 署 难 度 
为 了 衡量 分 解 模型 的 部 署 难度 ， 本 文选 择 了 模 
型 参数 所 占用 内 存 大 小 m 作为 主要 评价 指标 。m 越 
小 的 模型 ， 相 应 地 更 容易 部 署 在 拘 入 式 终端 。 
III. 实时 应 用 
为 了 衡量 分 解 模型 的 实时 性 ， 本 文选 择 了 模型 
的 平均 推理 速度 v 作为 主要 评价 指标 。v 越 大 的 模 
型 对 于 电器 负荷 信息 有 着 更 好 的 实时 反馈 能 力 。 特 
别 地 , 在 3.3.1 的 推理 速度 比较 中 , 本 文采 用 模型 分 
解 一 月 负荷 所 需 的 时 间 定 量 估 计 模 型 的 推理 速度 。 
2.1.2 ”辨识 准确 性 
为 了 衡量 负 蓓 分 解 模 型 的 辨识 准确 性 , 本 文 参 
考 相 关 的 统计 学 习 理 论 及 研究 M455, 选取 了 召回 率 
recall, EMX precision 、 马 修 斯 相关 系数 3 个 指 


标 作为 辨识 准确 性 评估 的 参数 , 指标 的 具体 计算 方 
式 如 下 : 
Recall = € (3) 
TP - FEN 
Precision = m (4) 
TP + FP 
MCC = TP-TN-FP-FN 
(TP + FP). (TP - FN)- (TN +FP)-(TN+ EN) 
(5) 


AP: TN 代表 真 阴性 样本 , 即 用 电器 实际 未 处 于 工 
作 状 态 且 算 法 分 解 结果 也 为 不 工作 的 时 间 戳 个 数 ; 
TP 代表 真 阳性 样本 ， 即 用 电器 实际 处 于 工作 状态 
且 算 法 分 解 结果 也 为 该 工作 状态 的 时 间 惟 个 数 ; 
EN 代表 假 阴 性 样本 ， 即 用 电器 实际 处 于 工作 状态 
但 算法 分 解 结果 为 不 工作 的 时 间 戳 个 数 ; FP 代表 假 
阳性 样本 ， 即 用 电器 实际 未 处 于 工作 状态 但 算法 分 
解 结果 为 工作 状态 的 时 间 戳 个 数 。recall 为 召回 率 ， 
即 阳性 样本 被 预测 正确 的 比率 ; precision 为 准确 率 ， 
即 做 出 阳性 样本 判断 的 正确 率 ; MCCC 为 马 修 斯 相 
关系 数 ， 其 值 介 于 -1 到 1 之 间 ， 越 接近 于 1 说 明 算 
法 的 辨识 性 能 越 好 。 

在 以 上 三 个 指标 中 ，MCC 相 较 于 以 往 研究 常 
采用 的 Fl 分 数 对 于 不 平衡 二 分 类 问题 的 评估 具有 
更 好 的 鲁 棒 性 567, 而 这 与 电器 负荷 事件 的 稀 玻 性 58l 


天 然 适应 。 但 与 此 同时 ， 保 留 召回 率 与 准确 率 作 为 
评价 指标 可 以 指出 分 解 模型 的 潜在 问题 在 哪里 ， 比 
如 召回 率 较 大 而 准确 率 较 小 的 模型 可 能 倾向 于 认 
为 一 个 用 电器 有 较 大 概率 处 于 开启 状态 ， 尽 管事 实 
并 非 如 此 ， 这 启发 研究 者 们 通过 调整 正 负 样本 的 比 
例 等 方式 来 改进 分 解 模型 的 辨识 性 能 。 
2.1.3 回归 准确 性 
为 了 衡量 负荷 分 解 模型 的 回归 准确 性 ， 本 文 
参考 相关 实验 及 理论 全 淹 ， 选 取 了 平均 绝对 误差 
MAE 、 归 一 化 误差 NEP 、 开 启 时 平均 绝对 误差 
OMAE 等 3 个 指标 作为 回归 准确 性 评估 的 参数 ， 
指标 的 具体 计算 方式 如 下 : 


[xus 
MAE - — > - Pil (6) 
t=1 
T 
bar - p,| 
NEP == (7) 
5 5 
t=1 
1 N 
OMAE -— |ê -el (8) 
NU 


AP: p, Ac MAAS, P, 为 1 时 刻 模 
型 分 解 得 到 的 电器 功率 ，7 为 测试 序列 的 时 间 长 度 ， 
e; 为 电器 开启 状态 下 第 个 时 间 惟 的 真实 功率 ，6 
为 电器 开启 状态 下 第 i 个 时 间 惟 模 型 分 解 得 到 的 电 


2.2” 现 有 公开 测试 数据 分 析 
在 进行 负荷 分 解 算法 评价 时 , 测试 数据 的 选择 
同样 会 对 评价 的 准确 性 与 全 面 性 产生 影响 .不同 数 
据 集 由 于 属性 上 的 差异 可 能 会 使 同一 分 解 算法 产 
生 差异 较 大 的 结果 , 同时 , 如果 待 测 电器 的 选择 过 
于 单一 ,将 会 对 分 解 算法 的 表现 产生 以 偏 概 全 的 认 
识 。 在 此 , 对 评价 框架 中 数据 集 与 待 测 电器 的 选择 
做 出 如 下 规范 。 
2.2.1 现 有 数据 集 特点 

为 了 对 不 同 数据 集 间 的 属性 差异 有 一 个 更 加 
清晰 的 认识 ， 本 文 根 据 文献 [60] 所 提 负 荷 事 件 统计 
方法 ， 利 用 NILMTK ft£28/9U, 5 NILM 领域 的 相 
关 数 据 集 做 了 如 下 整理 ， 如 附录 A K Al 所 示 ， 

MK Al 中 可 以 看 出 , AMPds2/?!, COMBED!9! 
等 数据 集 由 于 采样 频率 较 低 ， 容 易 遗 漏 一 些 负 蓓 信 
息 ， 为 负荷 分 解 增加 难度 ; IAWEISU, REDDE% 
据 集 由 于 数据 采集 的 持续 时 长 过 短 ， 难 以 为 一 些 深 
度 学 习 模 型 提供 充足 的 训练 数据 ;， 同 时 ， 日 均 负 荷 
事件 发 生 数 量 可 以 作为 家 庭 用 电 活 跃 程度 的 考察 ， 
其 值 越 大 ， 代 表 负 蓓 事件 越 密集 ， 负 荷 事 件 重 蕉 的 
可 能 性 也 就 越 大 ， 这 也 给 负荷 分 解 算法 提出 了 更 高 
的 要 求 。 综 上 ,本 文 建 议 使 用 UK-DALEI60 REFIT! 
等 数据 集 评 价 一 般 的 单 特 征 输入 分 解 算法 ， 对 于 融 


器 功率 ，N 为 测试 序列 中 电器 开启 状态 的 时 间 长 度 。 


值得 注意 的 是 ， 以 往 的 实验 通常 只 选择 MAE 
作为 回归 准确 性 的 评价 指标 ， 这 事实 上 并 不 能 很 好 
地 反应 模型 的 分 解 性 能 ， 只 需要 简单 地 将 每 一 时 刻 
的 功率 都 预测 为 0， 便 可 以 使 许多 小 功率 用 电器 的 
MAE 达到 一 个 较 小 的 值 , 对 此 , 本 文 建议 采用 归 一 
化 误差 NEP 来 消除 这 个 影响 。 同 时 ， 如 果 只 使 


合 了 多 种 功率 类 型 的 多 特征 输入 分 解 算法 [9 则 应 

相应 地 采用 AMPds2. iAWE 等 数据 集 进行 评估 。 

2.2.2” 待 测 电 器 选择 规范 
根据 文献 [69]， 家 用 电器 可 按 其 工作 时 的 功率 

消耗 模式 分 为 以 下 四 类 : 

表 1 四 类 电器 设备 的 功率 模式 特点 及 示例 


Table 1 Descriptions of four types of equipment 


MAE 与 NEP ， 许 多 不 常 使 用 的 家 用 电器 的 回归 误 
差 也 会 因为 测试 序列 的 时 间 长 度 7 较 大 的 基数 而 
被 平滑 ， 着 重 于 评估 用 电器 开启 时 分 解 效 果 的 
OMAE 可 以 较 好 地 解决 这 一 问题 。 
2.1.4 泛 化 性 能 

泛 化 性 能 的 考察 一 直 是 负荷 分 解 乃 至 深度 学 
习 领 域 的 开放 性 问题 59。 文献 [59] 提 出 了 负荷 分 解 
模型 泛 化 性 能 损失 的 概念 ， 但 它 只 衡量 模型 在 不 可 
见 场景 相 较 于 可 见 场景 性 能 的 下 降 程度 ， 忽 略 了 模 
型 可 能 在 可 见 场景 下 表现 较 差 这 一 问题 。 迁 移 学 习 
领域 的 研究 [69161 大 多 直接 考虑 模型 在 目标 域 ( 即 未 
见 场景 下 ) 的 性 能 , 因此 , 本 文 也 建议 研究 者 们 在 比 
较 不 同 模型 的 泛 化 性 能 时 计算 分 解 模型 在 未 见 场 
se PE MCC. MAE 等 指标 ， 并 与 可 见 场景 下 的 指 
标 结果 进行 比较 。 


类 别 功率 模式 特点 示例 
Type-I 工作 模式 只 有 开关 两 种 状态 的 电器 Ka 
Type-II 功率 在 有 限 离 散 集合 内 转换 的 电器 洗衣 机 
Type-II 功率 在 不 断 连 续 变化 的 电器 钻 孔 机 
Type-IV 功率 模式 呈 周 期 性 变化 的 电器 冰箱 


目前 ， 绝 大 部 分 分 解 算法 都 能 较 好 地 处 理 
Type-l. Type-IV 类 电器 ， 但 是 在 分 解 Type-I 类 电 
器 时 ， 许 多 算法 仍然 在 状态 转换 的 判断 上 存在 一 定 
R, EIF, Type- 类 电器 的 功率 分 解 依 然 是 
NILM 领域 的 难点 之 一 。 

为 了 更 加 综合 地 评价 负荷 分 解 算 法 ， 本 文 建议 
所 测试 的 电气 设备 类 型 应 尽量 涵盖 以 上 四 类 ， 并 特 
别 关 注 Type-I、Type-II 类 电器 的 分 解 情况 。 


3 算 例 分 析 


为 验证 本 文 提 出 的 负荷 分 解 算 法 评价 框架 对 
于 算法 评估 的 有 效 性 ， 本 节 利 用 该 框架 对 于 不 同 网 
络 结构 的 主流 深度 学 习 分 解 模型 进行 评价 与 比较 ， 
并 探究 了 输入 特征 对 于 模型 性 能 的 影响 。 
3.1 实验 设 定 
3.1.1 ”硬件 环境 及 软件 平台 

实验 硬件 环境 为 6 x Intel (R) Xeon (R) CPU E5- 
2678 v3 @ 2.50GHz 及 GeForce RTX 2080 Ti( 每 秒 
浮 点 运算 次 数 为 13.13TFLOPS, 显卡 内 存 为 11GB) 
的 64 位 计算 机 。 软 件 平台 为 python 3.7(64 位 )、 
PyTorch 1.7.0 深度 学 习 框 架 及 JupyterLab 集成 开发 
环境 。 在 训练 深度 学 习 模 型 时 使 用 PyTorch 的 
GPU 版 本 ， 利 用 GPU 进行 硬件 加 速 [0。 
3.1.2 ”模型 选择 

实验 涉及 模型 包括 文献 [13] 所 提 Bi-LSTM 模 
型 、DAE 模型 、[43] 所 提 Seq2Point 模型 、 [45] 所 
提 SGN-sp 模型 、[46] 所 提 CNN Attention 模型 及 
[25] 所 提 EnerGAN 模型 .其 中 , Bi-LSTM 属于 RNN 
类 模型 ，Seq2Point、SGN-sp、CNN_Attention 属于 
CNN 类 模型 , DAE、EnerGAN 属于 DAE 类 模型 。 
网 络 模型 的 拓扑 结构 见 附录 A 图 A1-A6。 在 实际 
实现 过 程 中 ,我 们 对 于 原始 论文 中 的 网 络 模型 进行 
了 改进 并 收获 了 更 好 的 分 解 性 能 ， 如 对 于 Bi- 
LSTM 模型 ， 将 其 第 二 个 Bi-LSTM 层 输出 的 所 有 
隐藏 状态 拼接 起 来 作为 全 连接 层 的 输入 [5 对 于 
EnerGAN 模型 ， 借 鉴 大 多 数 pix2pix 任务 的 思想 
[721073], 将 重建 损失 融入 生成 器 的 训练 过 程 , 使 其 迭 
代 收 敛 更 加 稳定 等 。 

更 多 的 网 络 模型 实现 细节 及 相关 代码 请 参考 ; 
https://github.com/Ming-er/NeuralNILM Pytorch. 
3.1.3. 实验 数据 选择 及 预 处 理 


score 归 一 化 预 处 理 。 
3.1.4 实验 方法 及 训练 设 定 

实验 时 , 考虑 到 不 同 的 超 参 组 合 对 于 模型 性 能 
的 影响 ， 学 习 率 、 优 化 器 、 初 始 化 方法 等 均 为 研究 
者 所 推荐 使 用 的 参数 设 定 捕 后， 这 些 设 定 由 研 
究 者 经 过 大 量 的 数值 实验 比较 得 出 , 可 以 认为 对 
不 同 场 景 下 的 负 蓓 分 解 问题 都 有 较 强 的 适应 性 。 
外 , 考虑 到 训练 的 随机 性 对 于 模型 性 能 的 影 
验 均 换 用 不 同 的 随机 数 种 子 重复 进行 多 次 3 
价 指标 计算 均值 ， 以 尽 可 能 真实 地 反映 模型 
最 后 , 为 了 防止 网 络 模 型 对 可 见 场景 的 过 拟 合 , 3 
验 设 置 模 型 训练 的 最 大 迭代 次 数 为 200 次 , 并 采用 
早 停 法 控制 网 络 的 训练 过 程 , 即 设置 3 个 迭代 周期 
后 模型 在 验证 集 损 失 不 下 降 便 停止 迭代 训练 。 
32 不同 网 络 结构 的 深度 学 习 分 解 模型 性 能 评估 

本 小 节选 取 了 不 同 网 络 结构 的 CNN Attention, 
Bi-LSTM、 DAE、Seq2Point、SGN-sp、EnerGAN 模 
型 在 所 提 算 法 评价 框架 下 进行 性 能 评估 。 模 型 的 输 
入 特征 均 为 有 功 功率 序列 PP， 实验 依 3.1 小 节 所 述 
设 定 进行 , 实验 过 程 中 模型 分 解 得 到 的 功率 曲线 见 
附录 B 图 B1-B5。 
3.2.1 模型 预 评估 

使 用 2.1.1 小 节 所 提 评 价 指标 对 上 述 模型 进行 
预 评估 ， 结 果 如 附录 表 A4。 可 以 看 出 ，Bi-LSTM 
模型 的 训练 、 才 时 均 较 长 , 这 是 因为 RNN 类 
模型 对 当前 时 间 步 负荷 信息 编码 时 需 整 合 前 一 时 
间 步 有 效 的 负荷 信息 , 这 样 的 工作 机 理 使 其 每 一 时 
间 步 的 训练 都 要 在 CPU 和 GPU 之 间 来 回调 度 ， 
难以 在 GPU 上 很 好 地 并 行 。 得 益 于 卷 积 操作 对 负 
荷 特征 的 并 行 抽取 能 力 ，Seq2Point 模型 有 着 更 优 
的 训练 、 推 理 效率 ，CNN Attention. 模型 虽然 在 
Seq2Point 模型 的 基础 上 引入 了 额外 的 注意 力 块 ， 
但 并 未 明显 地 影响 网 络 的 训练 、 推 理 用 时 及 内 存 占 
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实验 选取 了 UK-DALE 数据 集 及 冰箱 、 水 壶 、 
洗衣 机 、 微 波 炉 、 洗 碗 机 五 类 电器 用 以 评估 实验 。 
其 中 ， 水壶 、 微 波 炉 是 典型 的 Type-I 类 电器 ,洗衣 
机 、 洗 碗 机 为 Type-II 类 电器 ， 而 冰箱 则 属于 Type- 
IV 类 电器 , 上 述 选择 参考 了 以 往 负荷 分 解 算法 对 比 
工作 外 后 待 测 电器 多 为 研究 者 们 所 关注 的 类 别 ， 
可 以 在 一 定 程 度 上 反映 不 同 分 解 算法 对 于 不 同 电 
器 适应 性 的 差异 。 对 于 特定 的 电器 ， 保 证 其 在 相同 
场景 受 测 时 测试 集 与 训练 集 无 重 登 部 分 ， 并 对 总 、 
分 电表 数据 进行 下 采样 , 使 其 采样 间隔 为 30 秒 , 训 
练 场景 与 测试 场景 的 具体 时 段 划分 及 各 电器 设备 
的 输入 序列 长 度 见 附录 A 表 A2、A3。 对 于 训练 数 
据 与 测试 数据 ， 均 对 其 进行 了 文献 [13] 所 述 的 z- 
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用 ， 而 同属 于 CNN 类 模型 的 SGN-sp 模型 则 因 其 
庞大 的 参数 量 与 分 支 门 控 的 结构 设计 有 着 较 大 的 
训练 、 推 理 开 销 。 最后, 对 比 同样 结构 简单 的 DAE 
模型 ，EnerGAN 模型 较 长 的 训练 用 时 则 源 于 对 抗 
训练 的 过 程 。 
总 体 来 看 ，DAE 等 轻 量 级 网 络 在 模型 预 评估 
环节 表现 较 好 ,而 若 想 将 SGN-sp 等 大 规模 网 络 部 
署 到 能 入 式 终 端 , 则 需要 通过 相关 技术 压缩 网 络 模 
型 并 提高 其 实时 推理 速度 [一 5。 
3.2.2 辨识 准确 性 对 比 
使 用 2.1.2 小 节 所 提 评 价 指标 对 上 述 模 型 进行 
E 识 准确 性 对 比 ， 结 果 如 附录 图 A6 所 示 。 可 以 看 
上 ， 上 述 模型 对 于 开关 变化 模式 较为 简单 的 水 壹 、 


冰箱 两 类 电器 辨识 的 MCC 指标 都 达到 了 0.75 以 上 ， 
但 对 于 同属 于 type-I 类 电器 的 微波 炉 ， 网 络 辨识 的 
召回 率 Recall 较 低 ， 这 是 因为 数据 集中 微波 炉 的 负 
荷 事件 极为 稀疏 ， 网 络 更 加 倾向 于 预测 微波 炉 出 于 
关闭 状态 。 而 对 于 洗 碗 机 、 洗 衣 机 等 Type-I 类 电 
器 ， 除 SGN-sp 模型 外 ， 其 它 模型 的 辨识 精度 都 有 
不 同 程度 的 下 降 。 此 外 , Seq2Point. SGN-sp 等 CNN 
类 模型 对 于 Type-I 类 电器 的 辨识 准确 性 优 于 其 人 
模型 ， 这 在 一 定 程度 上 说 明了 卷 积 操作 对 于 功率 
值 变 化 的 探测 是 多 时 间 跨 度 、 多 功率 尺度 的 。 同 时 ， 
EnerGAN 模型 对 电器 状态 的 辨识 精度 要 优 于 DAE 
模型 ， 这 说 明 判 别 器 的 存在 可 以 在 对 抗 训练 的 过 程 
中 纠正 模型 对 于 负荷 事件 的 推理 。 

总 体 来 看 , CNN 类 模型 多 层次 、 多 尺度 的 卷 积 
核 增 强 了 其 对 不 同 持 续 时 长 、 不 同 功率 变化 幅 值 负 
荷 事件 的 把 握 能 力 。 同 时 ， 电 器 种 类 的 不 同 使 不 同 
模型 的 辨识 表现 出 现 了 较 大 差异 ， 说 明了 对 待 测 电 
器 选择 做 出 规范 的 必要 性 。 对 于 辨识 精度 不 高 的 模 
型 ， 研 究 者 们 可 以 效仿 EnerGAN 模型 进行 对 抗 学 
习 ， 以 提升 模型 对 于 负荷 事件 的 把 握 能 
3.2.3 回归 准确 性 对 比 
使 用 2.1.3 小 节 所 提 评 价 指标 对 上 述 模型 进行 
回归 准确 性 对 比 ， 结 果 如 附录 图 A7 所 示 。 单 从 
MAE 指标 可 以 看 出 ，SGN-sp 等 CNN 类 模型 对 于 
用 电器 的 功率 预测 更 为 准确 ， 原 因 在 于 卷 积 核 擅长 
提取 局 部 信息 并 学 习 功 率 的 不 同 变 化 模式 , AL CNN 
类 模型 的 辨识 准确 性 较 优 ， 而 状态 辨识 与 功率 预测 
两 个 任务 间 存 在 较 强 的 相关 关系 ; 但 从 OMAE 及 
附录 图 BI~BS 的 分 解 曲 线 来 看 ，Bi-LSTM 模型 对 
于 电器 开启 时 的 功率 回归 较为 准确 , 这 是 由 于 RNN 
类 模型 每 一 时 间 步 都 会 整合 上 一 时 间 步 的 负荷 信 
息 , 在 对 负荷 信息 建 模 的 连续 性 上 更 有 优势 。 同 时 ， 
SGN-sp. CNN Attention 模型 在 Type-I, II, IV 类 
用 电器 的 分 解 精度 均 优 于 Seq2Point, 这 说 明 引 入 用 
电器 的 开关 信息 流 及 加 权 融 合 卷 积 中 间 特 征 等 手 
段 都 可 以 促进 网 络 对 电器 功率 的 分 解 。 

此 外 ， 如 果 只 依据 MAE 这 一 指标 进行 评价 ， 
则 会 得 出 “模型 在 水 壶 等 电器 上 性 能 优异 ”这 一 错 
误 结论 ， 因 为 较 高 的 NEP 、OMAE 指标 表明 许多 
模型 对 电器 开启 时 的 功率 预测 仍 有 较 大 误差 ， 这 说 
明 本 文 所 提 评 价 框架 较 以 往 更 为 综合 全 面 。 

注意 到 EnerGAN 模型 对 于 水 壶 、 冰 箱 的 分 解 
Ha READS SGN-sp 等 模型 且 具 有 更 少 的 参数 量 、 
更 快 的 推理 速度 ， 而 Bi-LSTM、SGN-sp 等 模型 对 
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不 同 的 电器 设备 训练 不 同 的 模型 ， 
的 方式 给 出 最 终 的 分 解 结果 。 
3.2.4 泛 化 性 能 对 比 

对 分 解 算法 在 不 可 见 场景 测试 下 的 MAE. 
MCC 指标 整理 如 图 AS 所 示 。 可 以 看 出 ， 上 述 五 
类 深度 学 习 模型 在 不 可 见 场景 下 分 解 水 壶 、 冰 箱 等 
用 电器 相 较 于 可 见 场景 下 并 未 出 现 明显 的 泛 化 性 
能 损失 。 但 是 ， 模 型 在 分 解 功率 模式 更 为 复杂 的 
Type-II 类 用 电器 时 ， 其 MAE, MCC 等 指标 均 出 
现 了 不 同 程 度 的 下 降 , 且 网 络 结构 相对 更 为 复杂 的 
SGN-sp 等 模型 指标 下 降 的 幅度 更 为 明显 。 这 说 明 
深度 学 习 模型 对 于 Type-I 类 用 电器 的 泛 化 性 能 有 
待 增强 , 并 且 越 复杂 的 网 络 应 对 不 可 见 场景 时 的 结 
构 风 险 也 越 大 。 研 究 者 们 可 以 考虑 通过 数据 增强 
(76-78) 、 迁 移 学 习 [2 3 等 方式 来 提升 模型 的 泛 化 性 
能 , 并 通过 正则 化 等 方法 避免 复杂 网 络 对 可 见 场 景 
的 过 拟 合 。 未来, 对 于 模型 在 不 同 场景 的 泛 化 问题 
仍然 是 负荷 分 解 研究 的 核心 。 
3.3 ”不同 输入 特征 下 的 深度 学 习 分 解 模型 性 能 评估 

本 小 节选 取 了 Bi-LSTM, DAE, Seq2Point f 
型 ,在 所 提 算 法 评价 框架 下 评估 了 它们 在 输入 特征 
分 别 为 有 功 功 率 序 列 P, 有 功 功 率 序 列 P 及 无 功 功 
率 序 列 O， 有 功 功率 序列 已 及 视 在 功率 序列 S， 有 
功 功率 序列 Py 无 功 功 率 序 列 O 及 视 在 功率 序列 S 
时 的 模型 性 能 ， 实 验 依 3.1 小 节 所 述 设 定 进行 。 
3.3.1 模型 预 评估 
使 用 2.1.1 小 节 所 提 评 价 指标 对 上 述 模 型 进行 
预 评估 ， 结 果 如 附录 表 A5。 可 以 看 出 ， 输 入 特征 
维 数 的 增加 并 不 会 显著 地 增加 模型 的 时 空 复杂 度 ， 
却 可 以 在 训练 时 帮助 网 络 更 快 地 学 习 收 敛 。 但 在 实 
际 部 署 负荷 分 解 网 络 时 , 更 多 的 特征 维 数 意味 着 更 
大 的 数据 存储 需求 与 传输 带宽 占用 , 研究 者 们 可 以 
考虑 采取 压缩 感知 2 等 技术 对 多 传感器 采集 得 
到 的 数据 进行 处 理 , 以 减 小 垦 入 式 终 端的 运行 负 葵 。 
3.3.2 辨识 准确 性 对 比 
使 用 2.1.2 小 节 所 提 评 价 指标 对 上 述 模型 进行 
年 识 准确 性 对 比 ， 结 果 如 附录 图 A9 所 示 。 可 以 看 
4H， 当 增加 一 个 维度 的 输入 特征 时 ， 模 型 的 辨识 准 
角 性 便 可 以 得 到 显著 提升 。 具 体 地 ， 由 于 视 在 功率 
S 的 主要 成 分 为 有 功 功率 P， 二 者 间 存 在 较 强 的 共 
线性 关系 , 因此 使 用 无 功 功率 O 作为 附加 序列 特征 
可 使 网 络 学 到 更 为 丰富 的 负荷 信息 ， 对 于 辨识 性 能 
的 提升 也 更 加 明显 。 此 外 ， 当 使 用 P、QO、5S 三 个 输 
入 作为 特征 有 可 能 造成 网 络 输入 的 信息 元 余 ， 相 较 
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于 功率 状态 复杂 电器 的 分 解 更 有 优势 ， 研 究 者 们 可 
以 考虑 利用 模型 对 于 不 同 电器 设备 的 适应 性 ， 对 于 


T P. Q 两 个 输入 作为 特征 时 的 辨识 性 能 并 没有 较 
大 提升 。 最 后 ， 多 维特 征 输入 使 得 模型 辨识 水 壶 、 


微波 炉 的 召回 率 Recall 提升 明显 ， 在 一 定 程度 上 帮 
助 网 络 克 服 了 负荷 事件 过 于 稀疏 等 问题 ， 而 对 于 洗 
衣 机 、 洗 碗 机 等 运行 模式 复杂 的 Type I 类 电器 , 模 
型 辨识 的 准确 率 Precision 提升 显著 , 说 明 多 维特 征 
的 引入 强化 了 模型 对 于 复杂 负荷 事件 的 推理 判断 。 
3.3.3 回归 准确 性 对 比 
使 用 2.1.3 小 节 所 提 评 价 指标 对 上 述 模 型 进行 
回归 准确 性 对 比 ， 结 果 如 附录 图 A10 所 示 。 从 图 
A10 及 附录 图 B6~B10 的 分 解 曲线 可 以 看 出 ， 多 维 
特征 的 引入 都 显著 地 提升 了 模型 的 分 解 性 能 ， 但 是 
不 同 特征 引入 对 于 不 同 电器 分 解 效 果 的 提升 也 不 
RAHE. 此外, 多 维特 征 输入 模型 的 OMAE 相对 较 
低 ， 说 明 多 维 信息 的 加 入 可 以 提升 模型 对 于 电器 开 
启 时 的 功率 预测 精度 。 

从 不 同 网 络 间 性 能 及 分 解 曲线 的 横向 对 比 来 
看 ， 二 维特 征 输 入 的 轻 量 级 DAE 网 络 甚 至 可 以 取 
得 接近 于 一 维特 征 输入 的 Bi-LSTM 等 复杂 网 络 的 
辨识 、 回 归 准 确 性 ， 故 有 效 额外 特征 的 引入 不 失 为 
一 种 提升 模型 性 能 的 高 效 方法 。 
3.3.4 泛 化 性 能 对 比 
对 分 解 算法 在 不 可 见 场景 测试 下 的 MAE、 
MCC 指标 整理 如 图 Al11l 所 示 。 可 以 看 出 ， 多 维特 
征 的 引入 显著 地 提升 了 模型 对 于 冰箱 、 洗 衣 机 及 洗 


征 的 引入 甚至 可 能 会 使 网 络 的 学 习 出 现 负 迁移 现 
象 。 因此 , 若 想 通过 引入 附加 特征 的 方式 提升 模型 
的 泛 化 性 能 ,研究 者 们 需要 更 仔细 地 考虑 可 见 训练 
场景 与 不 可 见 测 试 场景 下 不 同 电器 在 各 个 特征 维 


度 下 的 电气 特性 。 

4 展望 
通过 上 文 的 讨论 中 不 难看 出 ， 目 前 非 侵入 式 负 

荷 分 解 领域 内 的 深度 学 习 方法 众多 ， 且 有 不 少 模型 


一 指标 ， 分 解 算法 也 大 多 集中 于 监督 式 学 习 方 法 ， 
需要 海量 的 标签 数据 对 模型 进行 训练 ， 而 在 现实 场 
景 中 获得 用 户 内 部 的 先 验 数据 难度 极 大 。 目 前 ,已 
有 的 迁移 学 习 方 法 依然 需要 部 分 目标 域 数据 (用 户 
内 部 的 先 验 数据 ) SCHEV AE, GRADE 
它 子 领域 的 元 学 习 [891 与 零 样本 学 习 9 方 法 几乎 不 
依赖 目标 域内 的 样本 ,可 以 极 大 程度 地 减少 模型 对 
于 现实 场景 的 数据 需求 ， 为 解决 负 蓓 分 解 模 型 在 未 
见 场景 的 泛 化 问题 提供 可 行 思路 。 

3) 图 信号 处 理 通过 定义 节点 和 加 权 邻 接 和 矩阵 
来 表示 数据 集 ， 具 有 训练 时 间 短 、 表 征 能 力 强 等 优 
A, 已 有 研究 将 其 应 用 于 负荷 分 解 问题 8。 近年 来 ， 
将 图 信号 处 理 与 神经 网 络 相 结合 的 图 神经 网 络 0 
可 以 充分 挖掘 数据 样本 间 的 联系 ， 有 效 地 处 理 社交 
网 络 等 图 关系 型 数据 。 若 能 将 图 神经 网 络 应 用 于 负 
荷 分 解 问题 ， 有 望 兼 有 二 者 的 优势 ， 并 显著 地 提升 
模型 的 分 解 性 能 。 此 外 ， 将 深度 学 习 方 法 与 其 它 传 
统 方法 结合 ， 也 可 以 在 克服 深度 学 习 方 法 对 标签 数 
据 依 赖 的 同时 大 幅 提升 传统 分 解 方法 的 性 能 。 

4) 此 外 , 功率 序列 中 长 短 距离 时 序 依赖 的 有 效 
把 握 、 不 常用 设备 负荷 事件 的 稀疏 性 引起 的 数据 集 
长 尾 分 布 、 小 功率 用 电器 易 被 同时 段 大 功率 用 电器 
履 盖 等 问题 依然 是 目前 限制 深度 学 习 分 解 模 型 性 
能 进一步 提升 的 瓶颈 所 在 。 对 于 时 序 建 模 ， 能 够 利 
用 序列 全 局 信息 的 Transformer 架构 中 、 动 态 调整 
时 间 窗 大 小 的 时 间 自 适应 卷 积 外! 等 方法 都 可 以 进 
一 步 增 强 深度 学 习 分 解 模型 对 于 不 同时 间 尺 度 负 
荷 事 件 的 把 握 能 力 ;， RE, th Sekt 
算 机 视觉 领域 重 加 权 鸣 、 混合 训练 9 等 策略 以 提升 
分 解 模 型 对 于 不 平衡 样本 训练 的 适应 性 。 
5 结语 


本 文 对 低频 非 侵入 式 负荷 分 解 中 的 深度 学 习 


可 以 达到 较 高 的 辨识 与 分 解 准确 率 ， 但 模型 在 实用 
性 、 鲁 棒 性 、 泛 化 性 等 方面 离 应 用 仍 有 一 定 差距 ， 
未 来 将 深度 学 习 应 用 至 低频 非 侵入 式 负荷 分 解 领 
域 可 以 重点 着 眼 于 以 下 几 个 方面 : 

1) 边缘 计算 物 联 网 架构 在 电力 领域 逐渐 得 到 
部 署 应 用 6， 然而 目前 基于 深度 学 习 的 分 解 模型 时 
空 复杂 度 依然 较 高 ， 可 以 通过 借鉴 模型 压缩 方向 的 
知识 蒸馏、 权重 剪 校 9、 网 络 量化 9、 神经 结构 
搜索 等 策略 对 模型 进行 压缩 处 理 。 此 外 ， 边 缘 计 
算 的 岁入 大 多 依赖 于 云 边 协同 等 技术 ， 边缘 节点 与 
云 计算 中 心 通信 时 的 数据 传输 效率 、 用 户 隐私 保护 
等 问题 也 号 待 解决 。 


2) 目前, 对 于 分 解 模 型 泛 化 性 能 的 评估 尚 无 统 


方法 进行 了 综述 、 比 较 与 展望 。 然 而 ， 受 限于 深度 
学 习 方 法 超 参 众多 、 解 释 性 差 、 训 练 随 机 等 固有 局 
限 ， 本 文 对 于 不 同 深度 学 习 负 蓓 分 解 模型 间 比 较 的 
探索 仍 是 初步 的 、 粗 粒度 的 。 未 来 ， 本 文 将 继续 应 
用 所 提 负 荷 分 解 算 法 综合 评价 框架 探索 深度 学 习 
分 解 模 型 对 于 超 参 选择 等 方面 的 敏感 性 ， 并 对 文中 
算法 比较 未 涉及 的 Type-II 类 电器 进行 后 续 研 究 。 
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Applications and Comparison of Deep Learning in Low Frequency Non- 
intrusive Load Disaggregation 


LI Yiming!, JU Yuntao!, QU Liao! 

(1. College of Information and Electrical Engineering, China Agricultural University, 
Beijing 100083, China) 
Abstract: Non-intrusive load disaggregation can comprehensively analyze user power 
consumption data and has been a crucial technology to evaluate users! flexible control potential. 
Since deep learning is currently the prevailing method of load disaggregation, the working 
mechanism of the three mainstream network structures, which includes denoising autoencoder, 
recurrent neural network and convolutional neural network, is discussed in detail when applying 
to load disaggregation, as well as their outlooks for applying in load disaggregation field. 
Afterwards, this paper proposes an evaluation framework for load disaggregation algorithms 
based on different dimensions and regularizes the selection of test data during the evaluation 
process accordingly. Finally, we make an empirical comparison of some mainstream deep learning 
disaggregation models by utilizing the proposed framework. And we also open source the code 
of the evaluation model. The evaluation result proves that the proposed framework can more 
comprehensively evaluate the deep learning disaggregation algorithms under specific hyper- 
parameters settings, and reveal the sensitivity of model performance to distinct network 
architectures and input features. 


Key words: deep learning; non-intrusive load disaggregation; convolutional neural network; 
recurrent neural network; electricity big data 


附录 A 


表 Al 常见 公开 数据 集 的 属性 对 比 


TableA1 A comparison of selected properties in common public datasets 


数据 集 房屋 持续 时 间 /d 采样 间隔 (总 )/s 采样 间隔 (分 )/s 功率 类 型 (总 ) ”功率 类 型 (分 ) 均 负 荷 事件 数 其 它 信 息 
AMPds2 730 60 60 VLBQS^ó VLPQSS 319 水 表 、 天 然 气 表 数 据 
COMBED 28 30 30 P P 463 无 

DRED 153 1 S S 604 天 气 数据 、 入 住 率 、 

房屋 布局 等 

iAWE 73 1 6 PQ,S PQ,S 497 天 气 数据 、 用 水 量 等 

REDD 36 1 3 S P 799 无 

REFIT 638 8 7 P P 320 天 气 、 天 然 气 表 数 据 

REFIT 8 888 8 7 P P 229 天 气 、 天 然 气 表 数 据 
UKDALE 658 1 6 PS PS 874 住户 人 员 构成 信息 
UKDALE 2 176 1 6 PS P 733 住户 人 员 构成 信息 


表 A2 特定 电器 训练 场景 与 测试 场景 的 选择 


Table A2 Selection of training and testing scenes for specific appliances 


电器 类 别 训练 房屋 /时 段 可 见 测试 房屋 /时 段 不 可 见 测试 房屋 ( 泛 化 )/ 时 段 
洗 碗 机 、 洗 衣 1/2013-06-01~2014-01-01 1/2014-01-01~2014-02-01 2/2013-06-01~2013-07-01 
机 、 冰 箱 5/2014-07-15~2014-10-15 5/2014-07-01~2014-07-15 
IKE 1/2013-06-01~2014-01-01 1/2014-01-01~2014-02-01 2/2013-06-01~2013-07-01 
微波 炉 5/2014-07-15~2014-09-15 5/2014-07-01~2014-07-15 
ik: 受 限于 UK-DALE 数据 集 提 供 的 功率 类 型 ， 房 屋 5 只 被 用 于 进行 单 输入 特征 负荷 分 解 算法 的 训练 与 测试 ， 即 3.3 小 节 算 例 
\ 再 使 用 房屋 5 进行 训练 与 测试 


表 A3 特定 电器 训练 时 输入 序列 时 间 跨 度 及 开启 时 功率 阐 值 


Table A3 Time span of input sequence and on threshold of specific appliances during training 


电器 类 别 输入 序列 时 间 跨 度 /s ri FR AE BR ELA 
洗 碗 机 3840 10 
微波 炉 1920 500 
IKE 1920 2000 
洗衣 机 3840 20 


冰箱 2880 50 


表 A4 3.2.1 小 节 网 络 模型 预 评估 结果 


Table A4 The results of model pre-evaluation in 3.2.1 Section 


网 络 模型 t /min m /MB v/s 
Bi-LSTM 21.7 17.05 112.9 
Seq2Point 7.8 24.93 11.1 
CNN Attention 9.1 25.95 13.2 
SGN-sp 44.0 78.67 35.3 
DAE 5.5 4.73 0.01 
EnerGAN 47.4 5.29 1.9 


ik: 表 头 中 变量 + 、 me v 的 定义 同 2.1.1 小节 


表 AS 3.3.1 小 节 网 络 模 型 预 评估 结果 


Table AS The results of model pre-evaluation in 3.3.1 section 


网 络 模 型 特征 维 数 t /min m /MB vis 
1 16.2 17.05 111.4 

Bi-LSTM 2 14.6 17.05 114.7 
3 13.1 17.05 117.8 

1 6.4 24.93 10.3 

Seq2Point 2 5.7 24.93 10.5 
3 4.9 24.93 10.6 

1 3.7 4.73 0.02 

DAE 2 3.6 4.73 0.02 

3 3.9 4.73 0.02 


TE: RSPR tL me v 的 定义 同 2.1.1 小节 


ik: 图 A1-A5 中 省 略 了 Padding, Flatten, Dropout 等 非 参 数 层 ， 读 者 可 根据 前 后 网 络 层 的 输入 输出 尺寸 
自行 推断 ， 更 多 细节 请 参考 相关 源码 。 
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图 A1 Seq2Point 模型 结构 示意 图 


Fig.A1 Schematic diagram of the structure of the Seq2Point model 


一 维 卷 积 层 双向 LSTM 层 双向 LSTM 层 


神经 元 个 数 : 128 神经 元 个 数 : 1 
激活 函数 : tanh 激活 函数 : Linear 


图 A2 Bi-LSTM 模型 结构 示意 图 
Fig.A2 Schematic diagram of the structure of the Bi-LSTM model 
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图 A4 SGN-sp 模型 结构 示意 图 


Fig.A4 Schematic diagram of the structure of the SGN-sp model 
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图 AS EnerGAN 模型 结构 示意 图 
Fig.A5 Schematic diagram of the structure of the EnerGAN model 
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图 A6 CNN Attention 模型 结构 示意 图 
Fig.A6 Schematic diagram of the structure of the CNN_Attention model 
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Fig.A7 A comparison of identification accuracy of five deep learning models 
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图 A8 五 种 深度 学 习 模 型 回归 准确 性 对 比 


Fig.A8 A comparison of regression accuracy of five deep learning models 
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Fig.A9 A comparison of transferability of five deep learning models 
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图 A10 不 同 输入 特征 下 深度 学 习 模 型 辨识 准确 性 对 比 


Fig.A10 A comparison of identification accuracy of deep learning models with different input features 
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(c) 不 同 输入 特征 下 DAE 模型 回归 准确 性 对 比 


图 ALL 不 同 输入 特征 下 深度 学 习 模 型 回归 准确 性 对 比 


Fig.A11 A comparison of regression accuracy of deep learning models with different input features 
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(a) 不 同 输入 特征 下 Seq2Point 模型 泛 化 性 能 对 比 
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(c) 不 同 输 入 特征 下 DAE 模型 泛 化 性 能 对 比 


图 A12 不 同 输入 特征 下 深度 学 习 模型 泛 化 性 能 对 比 


Fig.A12 A comparison of transferability of deep learning models with different input features 
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B1 3.2 小 节 不 同 网 络 分 解 冰箱 结果 曲线 图 


Fig.B1 Curve of fridge disaggregation results among different models in session 3.2 
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Fig.B2 Curve of kettle disaggregation results among different models in session 3.2 


B2 3.2 小 节 不 同 网 络 分 解 水 壶 结果 曲线 图 
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Fig.B3 Curve of dish washer disaggregation results among different models in session 3.2 


B3 3.2 小 节 不 同 网 络 分 解 洗 碗 机 结果 曲线 图 
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B4 3.2 小 节 不 同 网 络 分 解 洗衣 机 结果 曲线 图 


Fig.B4 Curve of washing machine disaggregation results among different models in session 3.2 
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Fig.B5 Curve of microwave disaggregation results among different models in session 3.2 


BS 3.2 小 节 不 同 网 络 分 解 微波 炉 结果 曲线 图 
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(c) Seq2Point 模型 在 不 同 输入 特征 下 分 解 冰箱 结果 曲线 图 


B6 3.3 小 节 不 同 特征 下 网 络 分 解 冰箱 结果 曲线 图 


Fig.B6 Curve of fridge disaggregation results among different input features in session 3.3 
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B7 3.3 小 节 不 同 特征 下 网 络 分 解 水 壶 结果 曲线 图 


Fig.B7 Curve of kettle disaggregation results among different input features in session 3.3 
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Fig.B8 Curve of dish washer disaggregation results among different input features in session 3.3 


图 B8 3.3 小 节 不 同 特征 下 网 络 分 解 洗 碗 机 结果 曲线 图 
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(c) Seq2Point 模型 在 不 同 输入 特征 下 分 解 洗衣 机 结果 曲线 图 


图 B9 3.3 小 节 不 同 特征 下 网 络 分 解 洗衣 机 结果 曲线 图 


Fig.B9 Curve of washing machine disaggregation results among different input features in session 3.3 
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(c) Seq2Point 模型 在 不 同 输入 特征 下 分 解 微波 炉 结果 
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B10 3.3 小 节 不 同 特征 下 网 络 分 解 微波 炉 结 果 曲 线 图 


Fig.B10 Curve of microwave disaggregation results among different input features in session 3.3 
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